[レポート]データメッシュの活用法: BioNTechがデータ&AIイノベーションを促進する方法 #AWSSummit #ANT304
2023年 5月4日, ドイツ ベルリンで開催された AWS Summit に参加しました。
コロナワクチンで有名な、バイオンテック (BioNTech) 社の事例についてレポートします。
バイオンテックBioNTech社は、もともと、がんを治療するための免疫療法に力を入れてきた企業で、ワクチンの開発の際にはアメリカのファイザー社とパートナー提携を結び、大きく飛躍した会社です。本社はドイツのマインツにあり、バイオンテック社の急成長でマインツ市の財政が安定したそうです。
今回の AWS Summit でのセッションでは、会社のビジネス規模も大きくスケールしたわけですが、個人的にはバイオテクノロジー業界でのクラウド活用時にどんなことを気にしているのかを垣間見れて、有意義なセッションでした。
新しく知れたこと
- 研究そのものが 1 つの国に閉じたままでは進まないこと
→ 国を跨ぐ、情報の連携が不可欠
- 研究所、臨床の現場、開発、製造、サプライチェーン、それぞれからデータが生成されていく
→ データ蓄積、データへのアクセスを円滑にすることが研究の成果につながる
- 個人情報、固有の技術などセンシティブなデータが多い
→ データへのコンプライアンス規制とアクセスコントロール
セッションの内容
注:アーキテクチャについては詳しく紹介されませんでした。
セッション概要
タイトル:Data Mesh in Action: How BioNTech Drives Data & AI Innovation
スピーカー:Aamna Najmi(Data Scientist, AWS), Daniel Gburek(Senior Director BioNData Factory, BioNTech)
BioNTech aims to create a fully integrated, enterprise-wide capability to discover, design and develop next-generation immunotherapies at scale by leveraging Data & AI technologies across the value chain – whether it's in-silico drug discovery, AI-optimized clinical trial protocols, or predictive maintenance in manufacturing. In this session, learn how BioNTech is building a Data & AI platform and driving organizational change with a decentralized data mesh approach. Also gain insight into how BioNTech is using Amazon Redshift Serverless, S3, Glue, and Lake Formation to enable secure and seamless data sharing and access management.
このセッションでは、BioNTechがどのようにデータ&AIプラットフォームを構築し、分散型データメッシュアプローチで組織の変化を促進しているかを学びます。また、BioNTechがAmazon Redshift Serverless、S3、Glue、Lake Formationを使用して、安全でシームレスなデータ共有とアクセス管理を実現している方法についての洞察も得られます。
タイトルにあるデータメッシュですが、ビジネスユニット、ビジネスドメインによってデータを編成する、非集中型のアーキテクチャだそうです。
スピーカーである Gburek氏は、中央集中型のデータベースは望ましくなかったと話していました。
アメリカの研究所、ドイツの研究所、病院関係者、販売担当など、それぞれのニーズに合ったツールをすでにたくさん使っている状況だったからです。BioNTech 社は AWS のスケール力を使って、データシェアのプラットフォーム BioNData を構築したそうです。
2022年に導入した BioNData
BioNData でできること
構築に使っている AWS サービス一覧
プラットフォーム構築の際の課題
- 再活用できるデータアセット
- ビジネスユニット毎にユースケース(要件)が違うため、バランスを保つ
- 品質ガイドライン GxP を満たす:Good x Practiceの略で、製造・管理・保管・流通段階における製品の安全性と確実性を確保することを目的に策定された、品質ガイドライン・規制
- ガバナンス、コンプライアンス遵守
BioNDataのデータシェアリング機能のデモも見せてくれました。
デモシナリオ
デモアーキテクチャ
補足: 1) Consumer:hogehogeに関するデータへのアクセスを要請、Producer によって承認されたら RedShift でクエリを実行する
2) Producer:Consumer に対してデータカタログ、テーブル、ビューを作成し閲覧許可、どこまでのデータを公開するかもコントロールできる
以上、レポートはここまでです。
感想
バイオンテック社のビジネス拡張と、研究の成果、その裏側に AWS の技術があると思うと、改めて AWS で実現できることの幅広さを改めて実感しました。
バイオテクノロジー業界でのクラウド導入で気をつけることについても間接的に学ぶことができ、今後の提案活動やお客様とのコミュニケーションに活用していきたいです。